SPSS 单样本符号检验 – 简单示例
作者:Ruben Geert van den Berg,发布于 Statistics A-Z & Nonparametric Tests
单样本符号检验 (Sign Test for One Median) 通常用于替代 单样本 t 检验 (One Sample T-Test),当数据不满足 t 检验的假设时。最常见的情况是分析一个似乎不服从 正态分布 (Normally Distributed) 且观测数量较少(比如 n < 30)的变量。对于较大的样本量,中心极限定理 (Central Limit Theorem) 确保了_均值_的 抽样分布 (Sampling Distribution) 将服从正态分布,而与数据值本身的分布无关。
本教程展示如何在 SPSS 中运行和解释符号检验。我们将使用 adratings.sav 数据集,部分数据如下所示。
SPSS 符号检验 - 零假设 (Null Hypothesis)
一家汽车制造商让 18 个人对 3 个商业广告的吸引力进行评分。他们使用百分制,从 0(极度没有吸引力)到 100(极度有吸引力)。一位营销人员认为,如果目标人群中至少有 50% 的人给某个商业广告的评分达到 80 或更高,那么这个广告就是好的。
现在,将 50% 最低分与 50% 最高分分隔开来的分数称为中位数 (Median)。换句话说,50% 的人口评分达到 80 或更高,等同于我们的零假设,即每个商业广告的人口中位数 (Population Median) 至少为 79.5。如果这是真的,那么由于随机抽样波动,我们样本中的中位数将_略有_不同。但是,如果我们在样本中发现非常不同的中位数,那么我们假设的 79.5 人口中位数是不可信的,我们将拒绝零假设。
快速数据检查 - 直方图 (Histograms)
首先,让我们快速看一下我们的数据是什么样的。我们将通过检查结果变量的直方图来做到这一点,运行以下语法。
***使用直方图快速检查结果变量。***
frequencies ad1 to ad3/format notable/histogram.
结果
首先,请注意,所有分布看起来都是合理的。由于每个变量的 n = 18,我们没有任何 缺失值 (Missing Values)。这些分布看起来不太像正态分布。再加上我们较小的样本量,这违反了 t 检验 (T-Tests) 所需的正态性假设,因此我们可能不应该运行 t 检验。
快速数据检查 - 中位数 (Medians)
我们的直方图包括 3 个结果变量的平均分数,但它们的中位数呢? 非常奇怪的是,我们无法使用 DESCRIPTIVES 计算中位数(这是描述性统计量)。我们可以使用 FREQUENCIES,但我们更喜欢从 MEANS 获得的表格格式,如下所示。
SPSS - 计算中位数语法
***检查 3 个结果变量的中位数。***
means ad1 to ad3/cells count mean median.
结果
只有我们的第一个商业广告(“家庭用车”)的中位数接近 79.5。其他 2 个商业广告的中位数要低得多。但是它们是否差异足够大,可以拒绝我们的零假设? 我们稍后会 выяснить 。
SPSS 符号检验 - 重新编码数据值 (Recoding Data Values)
SPSS 包含一个用于_两个_相关中位数的符号检验,但缺少用于一个中位数的符号检验。但是请记住,我们关于 79.5 人口中位数的零假设等同于 50% 的人口评分达到 80 或更高。并且 SPSS _确实_包含一个用于单个比例(百分比除以 100)的检验,称为 二项检验 (Binomial Test)。因此,我们将仅使用二项检验来评估每个商业广告评分达到 80 或更高的人口比例是否等于 0.50。
这里最简单的方法是 RECODE 我们的数据值:小于假设的人口中位数的值被重新编码为负号 (-)。大于此中位数的值获得加号 (+)。正是这些加号和减号赋予了符号检验其名称。等于中位数的值将从分析中排除,因此我们将它们指定为 缺失值 (Missing Values)。
SPSS RECODE 语法
***1. 将大于和小于中位数的值重新编码为加号和减号。***
recode ad1 to ad3 (79.5 = -9999)(lo thru 79.5 = 0)(79.5 thru hi = 1) into t1 to t3.
value labels t1 to t3 -9999 '等于中位数 (排除)' 0 '- (低于中位数)' 1 '+ (高于中位数)'.
missing values t1 to t3 (-9999).
***2. 快速检查结果。***
frequencies t1 to t3.
SPSS 二项检验菜单
小提示:二项检验是针对单个比例的检验,这是一个人口参数。所以它显然不是 非参数检验 (Nonparametric Test)。不幸的是,“非参数检验”通常指的是非参数检验和分布自由检验,即使这两者完全不同。
t1 是我们新创建的变量之一。它仅指示 ad1 是否为 80 或更高。完成这些步骤将生成以下语法。
SPSS 二项检验语法
***SPSS 二项检验语法,如粘贴所示。不要运行此命令,我们将首先对其进行编辑。***
NPAR TESTS
/BINOMIAL (0.50)=t1
/MISSING ANALYSIS.
修改我们的语法
奇怪的是,SPSS 的二项检验结果取决于案例的(任意)顺序:检验比例适用于数据中遇到的第一个值。如果 - 并且只有在 - 我们的检验比例为 0.50 时,这并不是一个主要问题,但它仍然会导致混乱的输出。我们将通过在每次检验之前按每个检验变量对我们的案例进行排序来避免这种情况。
修改后的二项检验语法
***案例的顺序会影响正在检验的零假设。因此,在检验每个变量之前,请对案例进行排序。***
sort cases by t1.
NPAR TESTS
/BINOMIAL (0.50)=t1
/MISSING ANALYSIS.
sort cases by t2.
NPAR TESTS
/BINOMIAL (0.50)=t2
/MISSING ANALYSIS.
sort cases by t3.
NPAR TESTS
/BINOMIAL (0.50)=t3
/MISSING ANALYSIS.
二项检验输出
我们将首先将我们的重点放在测试结果的第一个表格上,如下所示。
- N: 18 个案例中有 5 个的得分高于 79.5;
- 观察到的比例 (Observed Proportion) 为 (5 / 18 =) 0.28 或 28%;
- 假设的检验比例 (Test Proportion) 为 0.50;
- p(表示为 “精确显著性(双尾)(Exact Significance (2-tailed))”)= 0.096:如果人口比例确实为 50%,则发现我们的样本结果的概率约为 10%。 如果 p < 0.05,我们通常会拒绝我们的零假设,因此我们的二项检验_不会_反驳我们的人口中位数为 79.5 的假设。 在我们继续之前,让我们仔细看看我们的双尾 p 值 (P-Value) 0.096 的真正含义。
二项分布 (Binomial Distribution)
从统计学上讲,从 50% 的人得分达到 80 或更高的人群中抽取 18 位受访者类似于连续抛掷一枚平衡的硬币 18 次:我们可以抛出 0 到 18 个正面。如果我们一遍又一遍地重复我们的 18 次抛硬币,那么正面数量的抽样分布将非常类似于下图所示的二项分布。
最有可能的结果是 9 个正面,概率约为 0.19 或 19%。 对于 5 个或更少的正面(红色区域),P = 0.048。 现在,报告此单尾 p 值表明没有其他结果会反驳零假设。 这是不成立的,因为 13 个或更多的正面也不太可能。 因此,我们应该考虑我们从预期 9 个正面在两个方向上的 4 个正面的偏差,并将它们的概率加起来。 这导致我们的双尾 p 值为 0.096。
二项检验 - 更多输出
我们之前看到,我们的第二个商业广告(“年轻人用车”)的样本 中位数 (Median) 为 55.5。 我们的 p 值为 0.000 意味着,当人口中位数为 79.5 时,我们在 n = 18 的样本中发现此样本中位数的概率为 0%。 由于 p < 0.05,我们拒绝零假设:人口中位数_不是_ 79.5,而是 - 大概 - 低得多。我们将把它作为练习留给读者来解释第三个也是最后一个测试。